AnĂ¡lisis de Series Temporales
IOT Analytics
PreparaciĂ³n para analizar los datos. Series temporales
Objetivo
ProyecciĂ³n del consumo energĂ©tico a travĂ©s de series temporales.
Procedimiento
Estudiaremos los datos de consumo energético correspondientes a los años 2007 a 2009 a través de series temporales.
Haremos proyecciĂ³n de futuro para el año 2010 y compararemos los resultados con los datos reales de este Ăºltimo año (serie real).
Plot POA
Vamos a analizar la serie temporal del submedidor 3, aire acondicionado y termo elĂ©ctrico. Vamos a extraer 52 observaciones opr año, esto es igual a una observaciĂ³n diaria. Lunes a las 20h. Años 2007, 2008 y 2009
EvoluciĂ³n mensual del consumo. Años 2007-2009
Vamos a representar la serie por meses para cada submedidor y tambien para la energĂa global co granularidad mensual. En este caso, la frecuencia serĂ¡ 12, tenemos una observaciĂ³n por mes para los años 2007,8 y 2009.
Parece que los datos tienen estacionariedad (movimientos que se repiten cada año), esto ocurre para todas las variables.
EvoluciĂ³n diaria del consumo por meses
En este caso, crearemos una serie para cada mes, ya que la frecuencia de los datos no serĂ¡ la misma, al tener cada mes un nĂºmero de dĂas diferente.
Mes de Enero
Parece que no existen muchos patrones que nos podrĂan ayudar a hacer predicciones, no serĂan muy fiables. (grĂ¡fica muelle)
Mes de Febrero
Mes de Marzo
EvoluciĂ³n semanal del consumo. Años 2007-2009
Vamos a representar la serie por meses para cada submedidor y tambien para la energĂa global co granularidad mensual. En este caso, la frecuencia serĂ¡ 12, tenemos una observaciĂ³n por mes para los años 2007,8 y 2009.
Muelle
Forecasting antes de descomponer la serie
Vamos a plicar regresiĂ³n lineal a cada serie temporal, y veremos el valor de \(R^2\) y del error cuadrĂ¡tico medio.
EvoluciĂ³n mensual del consumo. Años 2007-2009
Modelo
Call:
tslm(formula = tsSM3_070809weekly ~ trend + season)
Residuals:
Min 1Q Median 3Q Max
-14.0000 -5.1012 -0.3333 1.2321 20.5654
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 10.10900 4.09735 2.467 0.0152 *
trend -0.01087 0.01462 -0.744 0.4586
season2 -3.52184 6.01621 -0.585 0.5596
season3 -3.84430 6.01534 -0.639 0.5242
season4 -9.50009 6.01451 -1.580 0.1173
season5 -3.82255 6.01371 -0.636 0.5264
season6 2.18832 6.01294 0.364 0.7166
season7 -4.13414 6.01222 -0.688 0.4932
season8 -9.45660 6.01152 -1.573 0.1187
season9 -3.77906 6.01086 -0.629 0.5309
season10 -3.76818 6.01024 -0.627 0.5321
season11 1.90936 6.00966 0.318 0.7513
season12 -3.41310 6.00910 -0.568 0.5713
season13 -9.40223 6.00859 -1.565 0.1207
season14 -9.39136 6.00811 -1.563 0.1211
season15 -3.04715 6.00766 -0.507 0.6131
[ reached getOption("max.print") -- omitted 37 rows ]
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 7.863 on 104 degrees of freedom
Multiple R-squared: 0.2639, Adjusted R-squared: -0.1042
F-statistic: 0.7169 on 52 and 104 DF, p-value: 0.9077
Resultados:
Valor del coeficiente de determinaciĂ³n: 0.2639. Es un valor muy bajo, el modelo Ăºnicamente explica el 28% de la variabilidad total.
No hay coeficientes significativamente no nulos (p.valores > 0.05). El modelo los supone todos nulos (significativamente)
PredicciĂ³n IC
PredicciĂ³n para los prĂ³ximos 20 dĂas
HabĂa predicciones negativas, esto es muy grave. No puede haber un consumo negativo de energĂa.
EvoluciĂ³n diaria del consumo por meses
Modelo
Call:
tslm(formula = tsSM3_DiariaEnero ~ trend + season)
Residuals:
Min 1Q Median 3Q Max
-5223.2 -1643.5 -128.2 1968.5 6090.7
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 7359.3708 1811.1381 4.063 0.00014 ***
trend -0.8762 12.5325 -0.070 0.94449
season2 1941.2095 2497.7856 0.777 0.44006
season3 -337.9143 2497.8799 -0.135 0.89284
season4 1701.2952 2498.0371 0.681 0.49842
season5 2241.8380 2498.2572 0.897 0.37305
season6 1754.3809 2498.5401 0.702 0.48525
season7 3264.9237 2498.8858 1.307 0.19627
season8 5867.7999 2499.2943 2.348 0.02215 *
season9 2021.6760 2499.7656 0.809 0.42180
season10 3640.5522 2500.2996 1.456 0.15051
season11 1613.7617 2500.8963 0.645 0.52117
season12 2887.3045 2501.5556 1.154 0.25292
season13 4624.5140 2502.2776 1.848 0.06943 .
season14 3936.0569 2503.0621 1.572 0.12101
season15 5955.9331 2503.9090 2.379 0.02052 *
[ reached getOption("max.print") -- omitted 16 rows ]
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 3059 on 61 degrees of freedom
Multiple R-squared: 0.3269, Adjusted R-squared: -0.01514
F-statistic: 0.9557 on 31 and 61 DF, p-value: 0.5438
Resultados:
Valor del coeficiente de determinaciĂ³n: 0.3269. Es un valor muy bajo, el modelo Ăºnicamente explica el 28% de la variabilidad total.
Solo hay tres coeficientes significativamente no nulos
PredicciĂ³n IC
EvoluciĂ³n semanal del consumo. Años 2007-2009
Submetering 1
Modelo
Call:
tslm(formula = tsSM1_Semanal ~ trend + season)
Residuals:
Min 1Q Median 3Q Max
-12556.7 -3075.5 452.3 3244.5 13131.7
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 11293.953 1296.107 8.714 4.86e-15 ***
trend -13.918 9.022 -1.543 0.125
season2 1125.309 1539.275 0.731 0.466
season3 2473.662 1539.355 1.607 0.110
season4 604.928 1539.487 0.393 0.695
season5 604.933 1539.672 0.393 0.695
season6 1954.938 1556.701 1.256 0.211
season7 2171.311 1556.805 1.395 0.165
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 5220 on 151 degrees of freedom
Multiple R-squared: 0.04277, Adjusted R-squared: -0.001608
F-statistic: 0.9638 on 7 and 151 DF, p-value: 0.4599
Resultados:
Valor del coeficiente de determinaciĂ³n: 0.04277. Es un valor extremadamente bajo, el modelo Ăºnicamente explica el 4.8% de la variabilidad total. Las predicciones no serĂ¡n nada fiables
Solo hay un coeficiente significativamente no nulo
PredicciĂ³n IC
Predicciones nada fiables, ademĂ¡s de los gigantes IC
Submetering 2
Modelo
Call:
tslm(formula = tsSM2_Semanal ~ trend + season)
Residuals:
Min 1Q Median 3Q Max
-15279.4 -3018.2 96.8 2999.8 14649.7
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 15204.325 1331.850 11.416 < 2e-16 ***
trend -49.469 9.271 -5.336 3.42e-07 ***
season2 1470.295 1581.724 0.930 0.3541
season3 2006.634 1581.805 1.269 0.2065
season4 1823.016 1581.941 1.152 0.2510
season5 3049.441 1582.131 1.927 0.0558 .
season6 3348.419 1599.630 2.093 0.0380 *
season7 2632.843 1599.737 1.646 0.1019
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 5364 on 151 degrees of freedom
Multiple R-squared: 0.1839, Adjusted R-squared: 0.1461
F-statistic: 4.861 on 7 and 151 DF, p-value: 5.754e-05
Resultados:
Valor del coeficiente de determinaciĂ³n: 0.04866. Es un valor extremadamente bajo, el modelo Ăºnicamente explica el 4.8% de la variabilidad total. Las predicciones no serĂ¡n nada fiables
Solo hay dos coeficientes significativamente no nulos
PredicciĂ³n IC
Predicciones nada fiables, ademĂ¡s de los gigantes IC
Submetering 3
Modelo
Call:
tslm(formula = tsSM3_Semanal ~ trend + season)
Residuals:
Min 1Q Median 3Q Max
-53120 -10573 2861 13217 35463
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 52739.86 4526.04 11.653 <2e-16 ***
trend 71.74 31.51 2.277 0.0242 *
season2 -21.70 5375.19 -0.004 0.9968
season3 4265.13 5375.46 0.793 0.4288
season4 3267.22 5375.93 0.608 0.5443
season5 6682.39 5376.57 1.243 0.2158
season6 2576.96 5436.04 0.474 0.6361
season7 3812.99 5436.40 0.701 0.4841
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 18230 on 151 degrees of freedom
Multiple R-squared: 0.04866, Adjusted R-squared: 0.004555
F-statistic: 1.103 on 7 and 151 DF, p-value: 0.3639
Resultados:
Valor del coeficiente de determinaciĂ³n: 0.04866. Es un valor extremadamente bajo, el modelo Ăºnicamente explica el 4.8% de la variabilidad total. Las predicciones no serĂ¡n nada fiables
Solo hay dos coeficientes significativamente no nulos
PredicciĂ³n IC
Predicciones nada fiables, ademĂ¡s de los gigantes IC
ComparaciĂ³n de los coeficientes de cada modelo
Submedidor RMSE R2
1 Cocina 4860.346 0.04277
2 Lavadero 5333.371 0.18390
3 AC y TermoE 25289.142 0.04866
Forecasting descomponiendo la serie (asĂ ok)
Descomponer: quitar tendencia
DescomposiciĂ³n y visualizaciĂ³n
Length Class Mode
x 157 ts numeric
seasonal 157 ts numeric
trend 157 ts numeric
random 157 ts numeric
figure 52 -none- numeric
type 1 -none- character
EvoluciĂ³n semanal del consumo. Años 2007-2009
Submetering 1
Length Class Mode
x 159 ts numeric
seasonal 159 ts numeric
trend 159 ts numeric
random 159 ts numeric
figure 7 -none- numeric
type 1 -none- character
Componente estacional muy fuerte, tendencia no.
Submetering 2
Length Class Mode
x 159 ts numeric
seasonal 159 ts numeric
trend 159 ts numeric
random 159 ts numeric
figure 7 -none- numeric
type 1 -none- character
Submetering 3
Length Class Mode
x 159 ts numeric
seasonal 159 ts numeric
trend 159 ts numeric
random 159 ts numeric
figure 7 -none- numeric
type 1 -none- character
EvoluciĂ³n mensual del consumo. Años 2007-2009
Submetering 1
Length Class Mode
x 36 ts numeric
seasonal 36 ts numeric
trend 36 ts numeric
random 36 ts numeric
figure 12 -none- numeric
type 1 -none- character
Componente estacional muy fuerte, tendencia no.
Submetering 2
Length Class Mode
x 36 ts numeric
seasonal 36 ts numeric
trend 36 ts numeric
random 36 ts numeric
figure 12 -none- numeric
type 1 -none- character
Submetering 3
Length Class Mode
x 36 ts numeric
seasonal 36 ts numeric
trend 36 ts numeric
random 36 ts numeric
figure 12 -none- numeric
type 1 -none- character
EvoluciĂ³n diaria del consumo por meses para los años 2007-2009
Submetering 1
Length Class Mode
x 93 ts numeric
seasonal 93 ts numeric
trend 93 ts numeric
random 93 ts numeric
figure 31 -none- numeric
type 1 -none- character
Tendencia creciente, parece que no hay mucha estacionalidad.
Submetering 2
Length Class Mode
x 93 ts numeric
seasonal 93 ts numeric
trend 93 ts numeric
random 93 ts numeric
figure 31 -none- numeric
type 1 -none- character
Submetering 3
Length Class Mode
x 93 ts numeric
seasonal 93 ts numeric
trend 93 ts numeric
random 93 ts numeric
figure 31 -none- numeric
type 1 -none- character